Pensando con la cámara: Un modelo multimodal unificado para la comprensión y generación centrada en la cámara
Un modelo unificado para mejorar la comprensión y generación centrada en la cámara, facilitando el proceso de análisis y creación de contenido visual.